周末强货:Goodchild — 关于GIS未来发展的四大预测
2011年,Esri公司的《ArcWatch》杂志曾请我预测未来GIS的发展方向,我提出五个想法:
GIS将适应室内环境
我们将有能力知道所有事物的位置
GIS将极大地得益于新兴的物联网
GIS将越来越多地往实时GIS方向发展
GIS的未来将能够表达地理的多个维度
四年后,所有五个方向都发展迅速,新的研究和产品不断涌现,GIS变化的速度比以往更加快速。目前已有几个令人兴奋的新发展出现在大家的视野中。
2015年,有四个GIS相关的主题开始在我的脑海中越来越清晰。但首先,我提出几个注意事项:所有对未来的讨论本质上都是投机,特别是像GIS这样飞速发展的技术领域。我不认为重编和回顾我1991年写的那两卷超过千页的大部头有什么意义,那里面完全没有提到互联网。此外,以下仅是我个人的猜测。我之所以把它写出来,部分是因为思考未来蛮有趣,另外又能在一定程度上刺激他人提供自己的想法。
任何关于GIS的讨论都必然会涉及到隐私问题,因为这项技术具有巨大的力量去捕获、存储和分析个人信息。
几年前,我的女儿在美国一大学教授交通工程,她带了一群学生去加拿大的多伦多。他们通过了移民和海关登记后入住了酒店,然后开始探索城市,拍下那些他们感兴趣的东西,如送货卡车和有轨电车。多伦多当时碰巧正在举办一个国际经济峰会,安保很严。当他们回到酒店几分钟后,就有了敲门声,加拿大安全情报局想问他们几个问题。
我们只能来猜测下这个调查需要哪些技术支持:遍布各处的安保摄像头;面部识别软件;与酒店、航空公司和移民记录等的实时连接。当然,虽然他们可能仅仅是被一个多疑的机构监控和跟踪,但现代监控技术的力量还是令人难以置信。
从本质上讲,隐私问题归根到底是数据控制问题:你对自身情况的数据有什么控制吗?例如,当你决定通过社交媒体分享个人信息时,同时大量关于你的个人信息就会落入一些公司和政府机构的手中。这些信息都是分散存在的,一旦中间有什么错误你想要纠正是十分困难的。在纽约布法罗大学的地理学教授Geoffrey·Jacquez把这种现象称之为“量化自我的巴尔干化。”
Goodchild指出,大数据需要一套全新的工具来实现集成和综合
假设你决定寻求一个更好的选择,即通过系统地收集和管理自己的个人资料,以决定谁在什么情况下可以获得关于你的什么信息。如果你想卖掉房子或者为家里的财产购买保险,你可能会创建一个房子的3D模型。如果你是一个学者,你可能会建一个数据库来管理所有的文件、讲稿和课堂笔记。如果你想跟踪环境危害对生活可能造成的影响,可能会建立一个数据库记录自己旅行和生活的地方。如果你最近恰好在健康上出现了一些问题,或者有某个保健专业人士想在研究中参考你的案例,那么你同意分享这些信息可能会对保健研究非常有用。
也许最诱人的是意识到这些数据潜在的经济价值。为什么我们要将我们使用信用卡购物的习惯信息拱手让给供应商?难道我们就不能自己来收集、管理甚至出售它吗?
最近,很多媒体在关注大数据和它的成功应用。大数据当然不仅是大,至少可以从三个特点来定义它,这三个特点通常被称为三V:
Volume(高容量)——数据量远超过过去我们能够轻松处理的范围
Variety(多类型)——今天我们通常可以找到关于任何问题的多个来源的相关数据
Velocity (高速度)——这些数据源都可以以实时的形式收集过来
大数据的数据源可以是遍布全球的传感器监测数据,也可以是来自公民的众包数据,但是这些数据由于缺乏抽样质检等质量控制机制,数据质量无法严格控制。
大量的数据对GIS来说并不是什么新鲜事。陆地卫星在1970年代早期就开始获取数据,数量之大远高于我们充分利用他们的能力。今天,有成千上万的视频图像监控摄像头部署在伦敦、英格兰和其他大城市,都是PT级的计算问题。多类型和高速度却是一个棘手的问题。在过去,地理信息是由专家精心组织制作的,比如国家地理空间情报局(NGA)或美国地质调查局(NSGS) 这样专业的机构。大数据需要一套全新的集成和综合工具,让有用和可靠的数据脱离原有的禁锢。速度也是全新的问题,因为GIS一开始是从环境地图发展起来的,旨在尽可能有效显示相对稳定的地物,比如山脉、河流和道路。
我们为何会如此惊讶?如果能解决这些问题,我们会获得什么?大数据成功的故事都是关于预测——明天的道琼斯工业平均指数或选举的结果——这就是为什么这个想法在工业和政府方面引起了如此大的关注。大数据对GIS的价值体现在预测方面,不是关于何时而是关于何地(有时也会有何时)。空间预测能回答这样的问题:
——下周飓风将肆虐到哪里?
——当我想买房时,我想知道这所房子五年后价值几何?
——今年的流感季最大的影响将是什么?
——零售连锁店的选址:哪里适合开新店?
可以说,大数据给GIS带来了很大的机遇,也为地理信息科学的研究带来了很多挑战。
在空间度量方面,GIS使用坐标来表示位置、几何图形、函数,并通过利用这些坐标来测量距离、斜坡和面积。但人类本身并没有坐标系的概念,因此不习惯于用大脑来计算距离、方向和其他属性,这也是为什么GIS如此重要并能取得成功的原因。
另一方面,人类习惯于通过命名来认识一个地方,大到大陆架小到自己房子的房间。他们在记忆中存储这些地方的相关信息,然后在与别人谈话的时候分享。人们虽然知道命名的地方之间的层级关系(比如西雅图在华盛顿州、西北太平洋、普吉特海湾低地和卡斯凯迪亚地区的国家),但是在他们的头脑中并不是在执行一个点在多边形上的操作。
今天,我们有很多工具将位置和空间联系起来。地名表和兴趣点数据库为我们提供命名地物要素的坐标参考系,然而它们在定位处理海量地物要素和没有明确界限的要素时并不奏效。例如,试着在谷歌上搜索从“科罗拉多”到“怀俄明”的路线(或在ArcGIS Online上搜索“密西西比河”的位置)。在这两种情况下的地名表所使用的系统会给两个大的区域要素一个中心点坐标,系统指定你从科罗拉多到怀俄明将假定你从这些州的几何中心开始和结束,并且你会被告知路线中有一部分在冬天是关闭的。
GIS一直是难以学习和使用的,这就是为什么我们需要在大学设置GIS课程来训练我们的GIS专业人员。近些年,因为有了响应式的界面、故事地图、ArcGIS广泛的在线帮助,情况已大幅改善,但即使在今天GIS一样并不容易使用。其中一个原因可能是因为GIS不同于人类固有的思考方式,所以人类必须学会用GIS进行表达和交流的新方法。
如果我们可以基于人类已有的思维方式建立一个技术帮助人类思考,它的好处是什么?首先,它将使我们能够利用人类通过现有技术无法共享和编译的与自身活动息息相关的大量与位置有关的信息。第二,它将使我们能够开发一套基于位置而不是空间的全新功能,比如为了清楚和实用,在自动生成平面草图地图时不妨牺牲一些地图的精确性。第三,它会建立更好的空间和实际世界之间的桥梁,大大缩短GIS的学习历程。
自从上个世纪60年代“GIS之父”Roger Tomlinson创建了GIS(Geographic Information System,GIS)这个缩写名词之后,这个领域已经发生了翻天覆地的变化。如今的学生在地理信息科学、测绘、空间信息系统等相关课程上都能遇到许多相同的基本内容。
GIS里面的G已经被解读为全球的(global)以及地理空间的(geospatial),而不是最初的地理的(geographic);S也不是当初的系统(system),而是科学(science)、服务(services)和研究(studies)。但是,要寻找一个词来描述这些所有内容的共同点,地理空间的(geospatial)或许是个最佳的选项。但是,它本身是个形容词,我们在表述的时候也有点别扭。
在我们即将发布的第四版教科书《地理信息科学和系统》中,我们认为,当前几乎所有的系统都集成了网络和云GIS,整个互联网正迅速成为一个巨大的GIS系统。我们认为,形成这个领域基本核心的是地理信息,以及用于捕捉、存储、表示、分析、建模、归档地理信息的流程。我们讨论GI数据库、GI科学、GI软件、GI专业人员,以及GI本身。或许,使用geoinformation这样的词我们也不觉得有什么违和感,在处理原始观测数据时,称geodata可能也没什么问题。
为什么这点对该领域的未来来讲特别重要?因为它的关键在于认识到这个领域已经扩大到什么程度。这就是为什么近几年加入我们这个领域的专家们可能从来就没有将其列为GIS,甚至可能不知道这个缩写词的确切意思。